    Yhtenäisten joukkojen määrä rajoitetun asteen verkoissa

    Suuntaamattoman verkon yhtenäinen joukko on solmujen osajoukko, jonka indusoima aliverkko on yhtenäisen. Tällaisten joukkojen lukumäärä eri verkkoperheissä on viime aikoina osoittautunut kiinnostavaksi suureeksi erityisesti algoritmien analyysin kannalta. Esimerkiksi kauppamatkustajan ongelma sekä niin sanottu Tutte-polynomi voidaan ratkaista ajassa, joka on polynomisen kertoimen päässä verkon yhtenäisten joukkojen määrästä. Koska täydellisen verkon kaikki osajoukot ovat yhtenäisiä, kysymykseksi on noussut erityisesti yhtenäisten joukkojen määrän asymptoottinen kasvu verkoissa, joiden suurin aste on rajoitettu. Tällä hetkellä paras tunnettu yläraja asymptoottiselle kasvulle tällaisissa verkoissa seuraa eräänlaiseen paikalliseen analyysiin perustuvasta entropiamenetelmästä. Ylärajan laatu riippuu olennaisesti siitä, kuinka monella tavalla mielivaltainen yhtenäinen joukko voi leikata kunkin solmun suljetun naapuruston. Tunnettu alaraja puolestaan seuraa yksinkertaisesta äärettömästä verkkoperheestä, jossa yhtenäisten joukkojen määrä osataan määrittää tarkasti. Kokeellisten arvioiden perusteella vaikuttaa kuitenkin selvältä, ettei kumpikaan nykyisistä rajoista ole tiukka ja lukumäärän asymptoottinen kasvu vaatii siten tarkempaa analyysiä. Käymme läpi tunnetut analyyttiset ja algoritmiset tulokset liittyen yhtenäisten joukkojen lukumäärään sekä yleisissä että rajoitetun asteen verkoissa. Laajennamme entropiaan perustuvaa menetelmää tarkastelemalla tavallisten naapurustojen sijaan solmujen yleistettyjä naapurustoja, jotka sisältävät kaikki enintään kiinnitetyn säteen r ≥ 2 päässä olevat solmut. Näytämme koneelliseen etsintään nojaten, että leikkausten suhteellinen lukumäärä on tällöin pienempi ja johtaa hieman parempaan ylärajaan, kun verkon suurin aste ∆ on 3 tai 4. Näytämme myös kokeellisiin havaintoihin vedoten, että laajennus ei oletettavasti paranna aikaisempaa ylärajaa millään ∆ > 5 tai r > 2. Avoimeksi kysymykseksi jää, voidaanko ylärajaa parantaa kehittämällä entropiaan perustuvaa menetelmää edelleen vai vaatiko tarkempi analyysi uudenlaista lähestymistapaa. Tarkastelemme kysymystä lopuksi toisesta suunnasta osoittamalla asymptoottiselle kasvulle alarajan yksinkertaisella konstruktiolla. Luomme myös katsauksen pieniin verkkoihin, joissa yhtenäisen joukkojen määrä on suurin mahdollinen, ja tarkastelemme lähemmin tällaisten verkkojen muita ominaisuuksia

    A faster tree-decomposition based algorithm for counting linear extensions

    We consider the problem of counting the linear extensions of an n-element poset whose cover graph has treewidth at most t. We show that the problem can be solved in time Õ(nt+3), where Õ suppresses logarithmic factors. Our algorithm is based on fast multiplication of multivariate polynomials, and so differs radically from a previous Õ(nt+4)-time inclusion–exclusion algorithm. We also investigate the algorithm from a practical point of view. We observe that the running time is not well characterized by the parameters n and t alone, fixing of which leaves large variance in running times due to uncontrolled features of the selected optimal-width tree decomposition. For selecting an efficient tree decomposition we adopt the method of empirical hardness models, and show that it typically enables picking a tree decomposition that is significantly more efficient than a random optimal-width tree decomposition. © Kustaa Kangas, Mikko Koivisto, and Sami Salonen; licensed under Creative Commons License CC-BY.Peer reviewe

    Kombinatorisia algoritmeja graafisten mallien oppimiseen

    Graphical models are a framework for representing joint distributions over random variables. By capturing the structure of conditional independencies between the variables, a graphical model can express the distribution in a concise factored form that is often efficient to store and reason about. As constructing graphical models by hand is often infeasible, a lot of work has been devoted to learning them automatically from observational data. Of particular interest is the so-called structure learning problem, of finding a graph that encodes the structure of probabilistic dependencies. Once the learner has decided what constitutes a good fit to the data, the task of finding optimal structures typically involves solving an NP-hard problem of combinatorial optimization. While first algorithms for structure learning thus resorted to local search, there has been a growing interest in solving the problem to a global optimum. Indeed, during the past decade multiple exact algorithms have been proposed that are guaranteed to find optimal structures for the family of Bayesian networks, while first steps have been taken for the family of decomposable graphical models. This thesis presents combinatorial algorithms and analytical results with applications in the structure learning problem. For decomposable models, we present exact algorithms for the so-called full Bayesian approach, which involves not only finding individual structures of good fit but also computing posterior expectations of graph features, either by exact computation or via Monte Carlo methods. For Bayesian networks, we study the empirical hardness of the structure learning problem, with the aim of being able to predict the running time of various structure learning algorithms on a given problem instance. As a result, we obtain a hybrid algorithm that effectively combines the best-case performance of multiple existing techniques. Lastly, we study two combinatorial problems of wider interest with relevance in structure learning. First, we present algorithms for counting linear extensions of partially ordered sets, which is required to correct bias in MCMC methods for sampling Bayesian network structures. Second, we give results in the extremal combinatorics of connected vertex sets, whose number bounds the running time of certain algorithms for structure learning and various other problems.Graafiset mallit ovat todennäköisyysmalleja, jotka esittävät muuttujien välisiä tilastollisia suhteita verkkona. Verkon jokainen solmu vastaa yhtä muuttujaa, ja solmujen väliset kaaret kuvaavat muuttujien välisiä riippuvuuksia. Graafinen esitystapa auttaa havainnollistamaan muuttujien kuvaamaa ilmiötä sekä usein mahdollistaa niiden yhteisjakauman esittämisen tiiviissä ja tehokkaasti käsiteltävässä muodossa. Graafisten mallien rakentaminen käsin on kuitenkin usein kohtuuttoman työlästä, mistä syystä niitä on pyritty oppimaan koneellisesti sovittamalla saatavilla olevaan havaintoaineistoon. Erityisesti verkon rakenteen oppiminen on haastava kombinatorinen ongelma, jota on ratkottu pitkälti likimääräisin menetelmin mutta erityisesti viime aikoina myös eksaktisti. Väitöskirjassa esitellään kombinatorisia algoritmeja rakenneoppimisongelman ratkaisemiseksi sekä kokeellisia ja analyyttisiä tuloksia ongelman vaativuudesta. Niin kutsutuille hajoaville graafisille malleille esitellään eksakti algoritmi, joka mahdollistaa sekä yhden optimaalisen verkon löytämisen että niin kutsutun bayesiläisen lähestymistavan, jossa opitaan jakauma kaikkien mahdollisten verkkojen yli. Jakaumasta voidaan joko poimia verkkoja satunnaisotannalla tai se voidaan tiivistää esimerkiksi verkon jokaisen kaaren marginaalitodennäköisyytenä. Bayes-verkot ovat toinen graafisten mallien perhe, joiden oppimiseen on viime aikoina esitetty useita eksakteja algoritmeja. Yksikään tällä hetkellä tunnettu algoritmi ei ole yksiselitteisesti muita nopeampi, vaan eri algoritmit toimivat nopeasti erityyppisillä syötteillä ja niiden ajoajan tarkka arviointi on osoittautunut vaikeaksi. Työn toisessa vaiheessa tutkitaan kokeellisesti, kuinka tällaisten algoritmien ajoaika riippuu annetusta syötteestä, sekä pyritään ennustamaan ajoaikaa koneoppimismenetelmin nopeimman algoritmin valitsemiseksi. Työn loppuosassa tutkitaan kahta kombinatorista ongelmaa, jotka ovat paitsi yleisesti kiinnostavia myös merkittäviä erityisesti Bayes-verkkojen oppimisessa. Ensimmäinen ongelma käsittelee osittaisjärjestysten lineaaristen laajennusten lukumäärän laskemista, jonka avulla korjataan vääristymiä satunnaisotantaan perustuvassa rakenneoppimisessa. Toinen kysymys koskee niin kutsuttujen yhtenäisten solmujoukkojen suurinta mahdollista lukumäärää, joka antaa ylärajan eräiden rakenneoppimisalgoritmien aikavaativuudelle. Suurimmalle lukumäärälle esitetään ylä- ja alarajoja verkoissa, joissa kunkin solmun naapurien lukumäärä on rajoitettu

    Counting Linear Extensions: Parameterizations by Treewidth

    We consider the #P-complete problem of counting the number of linear extensions of a poset (#LE); a fundamental problem in order theory with applications in a variety of distinct areas. In particular, we study the complexity of #LE parameterized by the well-known decompositional parameter treewidth for two natural graphical representations of the input poset, i.e., the cover and the incomparability graph. Our main result shows that #LE is fixed-parameter intractable parameterized by the treewidth of the cover graph. This resolves an open problem recently posed in the Dagstuhl seminar on Exact Algorithms. On the positive side we show that #LE becomes fixed-parameter tractable parameterized by the treewidth of the incomparability graph

    Empirical Hardness of Finding Optimal Bayesian Network Structures: Algorithm Selection and Runtime Prediction

    Various algorithms have been proposed for finding a Bayesian network structure that is guaranteed to maximize a given scoring function. Implementations of state-of-the-art algorithms, solvers, for this Bayesian network structure learning problem rely on adaptive search strategies, such as branch-and-bound and integer linear programming techniques. Thus, the time requirements of the solvers are not well characterized by simple functions of the instance size. Furthermore, no single solver dominates the others in speed. Given a problem instance, it is thus a priori unclear which solver will perform best and how fast it will solve the instance. We show that for a given solver the hardness of a problem instance can be efficiently predicted based on a collection of non-trivial features which go beyond the basic parameters of instance size. Specifically, we train and test statistical models on empirical data, based on the largest evaluation of state-of-the-art exact solvers to date. We demonstrate that we can predict the runtimes to a reasonable degree of accuracy. These predictions enable effective selection of solvers that perform well in terms of runtimes on a particular instance. Thus, this work contributes a highly efficient portfolio solver that makes use of several individual solvers.Peer reviewe

    A Scalable Scheme for Counting Linear Extensions

    Counting Linear Extensions in Practice : MCMC versus Exponential Monte Carlo

    Counting the linear extensions of a given partial order is a #P-complete problem that arises in numerous applications. For polynomial-time approximation, several Markov chain Monte Carlo schemes have been proposed; however, little is known of their efficiency in practice. This work presents an empirical evaluation of the state-of-the-art schemes and investigates a number of ideas to enhance their performance. In addition, we introduce a novel approximation scheme, adaptive relaxation Monte Carlo (ARMC), that leverages exact exponential-time counting algorithms. We show that approximate counting is feasible up to a few hundred elements on various classes of partial orders, and within this range ARMC typically outperforms the other schemes.Peer reviewe

    New genetic loci link adipose and insulin biology to body fat distribution.

    Body fat distribution is a heritable trait and a well-established predictor of adverse metabolic outcomes, independent of overall adiposity. To increase our understanding of the genetic basis of body fat distribution and its molecular links to cardiometabolic traits, here we conduct genome-wide association meta-analyses of traits related to waist and hip circumferences in up to 224,459 individuals. We identify 49 loci (33 new) associated with waist-to-hip ratio adjusted for body mass index (BMI), and an additional 19 loci newly associated with related waist and hip circumference measures (P < 5 × 10(-8)). In total, 20 of the 49 waist-to-hip ratio adjusted for BMI loci show significant sexual dimorphism, 19 of which display a stronger effect in women. The identified loci were enriched for genes expressed in adipose tissue and for putative regulatory elements in adipocytes. Pathway analyses implicated adipogenesis, angiogenesis, transcriptional regulation and insulin resistance as processes affecting fat distribution, providing insight into potential pathophysiological mechanisms

    Asiakkaiden menestymisen varmistaminen SaaS-liiketoiminnassa

    Tämän opinnäytetyö tehtiin toimeksiantona suomalaiselle teknologiayritykselle. Opinnäytetyön tavoitteena oli selvittää toimeksiantajan nykyiset käytännöt sekä mahdolliset haasteet customer success -menetelmän toteutuksessa sekä antaa mahdollisia kehitysehdotuksia. Haasteet ja nykyiset käytännöt selvitettiin haastattelemalla yrityksen työntekijää, joka toimii olemassa olevien asiakkaiden parissa. Customer success -menetelmä on yksi SaaS-bisneksen (software as a service) kulmakivistä. Sen tavoitteena on varmistaa, että asiakkaat saavat arvoa ostamastaan tuotteesta tai palvelusta sekä menestyvät sen avulla. Menestyksekkäästi customer success - menetelmää toteuttava yritys pienentää asiakaspoistumaa, lisää uusia myyntimahdollisuuksia ja tuottaa menestyviä asiakkaita. Opinnäytetyö koostuu teoriaosuudesta ja teemahaastatteluun nojaavasta nykytilan kartoituksesta. Teoriaosuuteen kuuluu kolme kappaletta. Teoriaosuuden ensimmäisessä kappaleessa käsitellään ensin pääpiirteittäin asiakassuhteiden johtamista, asiakassegmenttejä ja avainasiakkaiden johtamista. Toisessa kappaleissa käsitellään customer success -menetelmän eri aihealueita, jotka olin valinnut toimeksiantajaa silmällä pitäen. Viimeisessä kappaleessa käsitellään customer success -menetelmään kuuluvia mittareita. Työ oli onnistunut ja tavoitteeseen päästiin. Haastattelussa saatiin selville yrityksen nykyiset haasteet, joita verrattiin teoriaosuuteen kehitysehdotuksia kirjoitettaessa. Kehitysehdotuksissa mallinsin käyttöönottoprosessin ja asiakkaan menestyspolun, joita toimeksiantaja voi hyödyntää customer success -menetelmän kehittämisessä. Kokonaisuudessaan työn tuloksia voi hyödyntää myös yleisten tiimien välisten pelisääntöjen sopimisessa.This thesis was conducted as an assignment for a Finnish based technology company. The purpose of the thesis was to find out the current practices and challenges of the case company regarding the customer success method and give possible development suggestions. The challenges and current practices were clarified by interviewing a company employee who is working with existing customers. The Customer Success method is one of the important things in the SaaS business (software as a service). The goal of customer success is to ensure that the customers get value from the product or service and that they succeed with it. A company with functional customer success will reduce churn, increase new sales opportunities and generate successful customers. The thesis consisted of a theoretical part and a research part. Theoretical part contains three chapters, each dealing with different topics. The first part dealt with customer relationship management, customer segments, and key account management. For the second part I had chosen different topics off the customer success method, suitable for the case company. The last part dealt with customer success metrics. The work was successful, and the goal was achieved. The interview revealed the case company’s current challenges. Improvement suggestions were made by comparing results from the interview and theoretical part. In the final part, I model the onboarding process and the customer success journey map that a case company can use to develop the customer success method. The client can use the results of the work to develop the customer success method and to agree on the general rules. Whole results can also be used to agree on the rules between teams